☰
7.6.3 평가용 골든 데이터셋(Evaluation Golden Dataset) 구축 및 벤치마킹
Home
/
소프트웨어 공학 (Software Engineering)
/
제목: 오라클: AI 주도 개발을 위한 해답
/
Chapter 7. LLM-as-a-Judge: 평가용 AI 모델을 활용한 하이브리드 오라클 시스템
/
7.6 Meta-Evaluation: 오라클 자체의 신뢰성 검증
/
7.6.3 평가용 골든 데이터셋(Evaluation Golden Dataset) 구축 및 벤치마킹
7.6.3 평가용 골든 데이터셋(Evaluation Golden Dataset) 구축 및 벤치마킹